花费 7 ms
Spark on Yarn详解

Spark 可以跑在很多集群上,比如跑在local上,跑在Standalone上,跑在Apache Mesos上,跑在Hadoop YARN上等等。不管你Spark跑在什么上面,它的代码都是一样的,区 ...

Mon Dec 30 05:35:00 CST 2019 0 3806
Spark Web UI 监控详解

Spark集群环境配置 我们有2个节点,每个节点是一个worker,每个worker上启动一个Executor,其中Driver也跑在master上。每个Executor可使用的核数为2,可用的内存 ...

Wed Jan 15 06:25:00 CST 2020 0 2578
Spark原理及关键技术点

Spark Apache Spark 是专为大规模数据处理而设计的快速通用的计算引擎。Spark是UC Berkeley AMP lab (加州大学伯克利分校的AMP实验室)所开源的类Hadoop ...

Fri Dec 27 06:45:00 CST 2019 0 1111
Antlr4 语法解析器(下)

Antlr4 的两种AST遍历方式:Visitor方式 和 Listener方式。 Antlr4规则文法: 注释:和Java的注释完全一致,也可参考C的注释,只是增加了JavaDoc类型的注 ...

Wed Jul 14 03:25:00 CST 2021 3 167
Antlr4 语法解析生成器(上)

简介 Spark SQL、Presto --> Antlr4 SQL 解析器 Flink SQL --> Apache Calcite(通过JavaCC 实现) Spark SQL如 ...

Mon Mar 01 01:40:00 CST 2021 0 416
数据湖-Apache Hudi

Hudi特性 数据湖处理非结构化数据、日志数据、结构化数据 支持较快upsert/delete, 可插入索引 Table Schema 小文件管理Compaction ...

Sat Jan 30 21:12:00 CST 2021 0 443

 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM